智能论文笔记

Identifiability of deep generative models under mixture priors without auxiliary information

Bohdan Kivva , Goutham Rajendran , Pradeep Ravikumar , Bryon Aragam

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-20

我们证明了（a）具有通用近似功能的广泛的深层变量模型的可识别性，并且（b）是通常在实践中使用的变异自动编码器的解码器。与现有工作不同，我们的分析不需要弱监督，辅助信息或潜在空间中的条件。最近，研究了此类模型的可识别性。在这些作品中，主要的假设是，还可以观察到辅助变量$ u $（也称为侧面信息）。同时，几项作品从经验上观察到，这在实践中似乎并不是必需的。在这项工作中，我们通过证明具有通用近似功能的广泛生成（即无监督的）模型来解释这种行为，无需侧面信息$ u $：我们证明了整个生成模型的可识别性$ u $，仅观察数据$ x $。我们考虑的模型与实践中使用的自动编码器体系结构紧密连接，该体系结构利用了潜在空间中的混合先验和编码器中的Relu/Leaky-Relu激活。我们的主要结果是可识别性层次结构，该层次结构显着概括了先前的工作，并揭示了不同的假设如何导致可识别性的“优势”不同。例如，我们最薄弱的结果确定了（无监督的）可识别性，直到仿射转换已经改善了现有工作。众所周知，这些模型具有通用近似功能，而且它们已被广泛用于实践中来学习数据表示。

translated by 谷歌翻译

Learning latent causal graphs via mixture oracles

Bohdan Kivva , Goutham Rajendran , Pradeep Ravikumar , Bryon Aragam

分类：机器学习 | 人工智能 | (统计)机器学习

2021-06-29

我们研究了在存在潜在变量存在下从数据重建因果图形模型的问题。感兴趣的主要问题是在潜在变量上恢复因果结构，同时允许一般，可能在变量之间的非线性依赖性。在许多实际问题中，原始观测之间的依赖性（例如，图像中的像素）的依赖性比某些高级潜在特征（例如概念或对象）之间的依赖性要小得多，这是感兴趣的设置。我们提供潜在表示和潜在潜在因果模型的条件可通过减少到混合甲骨文来识别。这些结果突出了学习混合模型的顺序的良好研究问题与观察到和解开的基础结构的问题之间的富裕问题之间的有趣连接。证明是建设性的，并导致几种算法用于明确重建全图形模型。我们讨论高效算法并提供说明实践中算法的实验。

translated by 谷歌翻译

Bitcoin Price Predictive Modeling Using Expert Correction

Bohdan M. Pavlyshenko

分类：机器学习

2022-01-06

本文研究了比特币价格的线性模型，包括基于比特币货币统计数据的回归特征，采矿过程，谷歌搜索趋势，维基百科页面访问。与价格时间序列相比，来自实际价格的回归模型预测的偏差模式更加简单。假设可以通过经验丰富的专家预测该模式。以这种方式，使用回归模型和专家校正的组合，可以获得比任何回归模型或专家意见的更好的结果。结果表明，贝叶斯方法使得可以利用具有脂肪尾部的分布的概率方法，并考虑比特币价格时间序列中的异常值。

translated by 谷歌翻译

Sales Time Series Analytics Using Deep Q-Learning

Bohdan M. Pavlyshenko

分类：机器学习 | 自然语言处理

2022-01-06

本文介绍了深度Q学习模型在销售时间序列分析问题中的使用。与使用历史数据的一种被动学习的监督机器学习相比，Q-Learning是一种积极的学习，目标是通过最佳的行动序列来最大化奖励。在工作中考虑了用于最佳定价策略和供需问题的免费Q学习方法。该研究的主要思想是表明，在时间序列分析中使用深度Q学习方法，可以通过使用参数模型和中建模学习代理交互的环境来最大化奖励功能来优化动作序列。使用基于历史数据的模型的情况。在定价优化案例研究环境中，使用销售依赖性对额外价格和随机模拟需求进行建模。在定价优化案例研究中，使用销售依赖性对额外价格和随机模拟需求进行建模。在供需案例研究中，建议使用环境建模的历史需求时间序列，代理商国家由促销行动，以前的需求值和每周季节性特征代表。获得的结果表明，使用深度Q学习，我们可以优化价格优化和供需问题的决策过程。使用参数模型和历史数据的环境建模可用于学习代理的冷启动。在下一个步骤，冷启动后，培训的代理可用于真正的商业环境。

translated by 谷歌翻译

Forming Predictive Features of Tweets for Decision-Making Support

Bohdan M. Pavlyshenko

分类：自然语言处理 | 人工智能 | 机器学习

2022-01-06

本文介绍了用于形成推文数据集的不同预测特征的方法，并在预测分析中使用它们进行决策支持。图表理论以及频繁的项目集和关联规则理论用于形成和检索来自这些Datesests的不同特征。这些方法的使用使得可以在与指定实体相关的推文中揭示语义结构。结果表明，语义频繁项目集的定量特性可以用于具有指定目标变量的预测性回归模型。

translated by 谷歌翻译

Bayesian Regression Approach for Building and Stacking Predictive Models in Time Series Analytics

Bohdan M. Pavlyshenko

分类：人工智能 | 自然语言处理 | 机器学习

2022-01-06

本文介绍了贝叶斯回归对建筑时间序列模型的使用和堆叠不同预测模型的时间序列。分析了利用贝叶斯回归与非线性趋势的时间序列建模。这种方法使得可以估计时间序列预测的不确定性并计算风险特征的价值。考虑了使用贝叶斯回归的时间序列的分层模型。在这种方法中，对于所有数据样本，一组参数是相同的，对于不同的数据样本，其他参数可以不同。这样的方法允许在指定时间序列的短期数据的情况下使用该模型，例如，在销售预测问题的新商店或新产品的情况下。在预测模型堆叠的研究中，模型Arima，神经网络，随机森林，额外的树用于对第一级模型集合的预测。在第二级，验证集上这些模型的时间序列预测用于贝叶斯回归堆叠。这种方法给出了这些模型的回归系数的分布。它可以估计每个模型对堆叠结果贡献的不确定性。有关这些分布的信息允许我们选择最佳的堆叠模型集，同时考虑到域知识。堆叠预测模型的概率方法使我们能够对决策过程中重要的预测进行风险评估。

translated by 谷歌翻译